今天繼續介紹一個跟另一個爬蟲的第三方套件 : BeautifulSoup
處理回應,即處理html
定位HTML
`pip install bs4`
利用find跟findAll找出所有標籤
find : 只會找出第一個標籤
findAll : 找出所有符合條件的標籤
soup.find(name, attrs, recursive, text, **kwargs)
from bs4 import BeautifulSoup
html = '<div class="example">it30!!!</div><div class="example">day23!!!</div>'
soup = BeautifulSoup(html, 'html.parser')
# 查找第一個 class 為 "example" 的 div 標籤
div_tag = soup.find('div', {'class': 'example'})
print(div_tag.text) # 輸出:it30!!!
soup.findAll(name, attrs, recursive, text, limit, **kwargs)
from bs4 import BeautifulSoup
html = '<div class="example">it30!!!</div><div class="example">day23!!!</div>'
soup = BeautifulSoup(html, 'html.parser')
# 查找所有 class 為 "example" 的 div 標籤
div_tags = soup.findAll('div', {'class': 'example'})
for tag in div_tags:
print(tag.text)
# 輸出:
# it30!!!
# day23!!!
明天見!